勇闯「AI 创业激战区」,Medeo 在想什么?|和晨然聊 AI 视频产品、年轻人的机会
勇闯「AI 创业激战区」,Medeo 在想什么?|和晨然聊 AI 视频产品、年轻人的机会上周,AI 视频生成工具 Medeo[1] 发布,用户输入文字描述,它会自动完成拆分镜头、生成脚本、添加音乐和生成视频等一系列操作,当天在我们的朋友圈里引发了小型「刷屏」。
上周,AI 视频生成工具 Medeo[1] 发布,用户输入文字描述,它会自动完成拆分镜头、生成脚本、添加音乐和生成视频等一系列操作,当天在我们的朋友圈里引发了小型「刷屏」。
“不够年轻。”2023 年初,我们第一次和投资人聊到正在筹备创业的王长虎时,这是对方的第一反应。
Chris Pelkey,一位枪击案受害者,对法庭如是说道。但这并不是他本人。他在 2021 年的一次路怒枪击事件中,已经不幸去世。庭审现场上播放的,是以 Pelkey 的形象和声音制作的 AI 视频。
有博主利用一款名为 Higgsfield 的 AI 视频生成工具,一比一复刻了这些镜头,效果不说一模一样,只能说是毫无区别。据博主介绍,只需上传一张歌手的图像,选择 Higgsfield AI 的「Mouth In」(嘴部特写)镜头运动功能,几分钟内就能生成上面这个专业级镜头。
自 OpenAI 发布 Sora 以来,AI 视频生成技术进入快速爆发阶段。凭借扩散模型强大的生成能力,我们已经可以看到接近现实的视频生成效果。但在模型逼真度不断提升的同时,速度瓶颈却成为横亘在大规模应用道路上的最大障碍。
今天凌晨,Runway的新版本Gen-4又试图解决AI视频的一个关键难题,让AI视频更靠近电影级。这一切都只发生在短短的2个多月内,很难想象今年AI会发展到什么程度,或许今年将会是GPT-3.5后真正的AI爆发年。
近一年以来,AI 视频生成技术发展迅猛。自 2024 年初 Sora 问世后,大家惊喜地发现:原来 AI 可以生成如此逼真的视频,一时间各大高校实验室、互联网巨头 AI Lab 以及创业公司纷纷入局视频生成领域。
下班回家后你正深陷于一部两小时的综艺节目中,渴望找到那些让人捧腹的爆笑片段,却如同大海捞针。或者,在紧张刺激的足球赛中,你渴望捕捉到那决定性的绝杀瞬间,但传统 AI 视频处理技术效率低下,且模型缺乏泛化能力。为解决这些问题,香港中文大学(深圳)唐晓莹课题组联合腾讯 PCG 发布 TRACE 技术,通过因果事件建模为视频理解大模型提供精准的时间定位能力。
洛杉矶初创公司 Moonvalley 推出了一款 AI 视频生成模型,该公司声称这是少数基于公开许可(非版权)数据训练的模型之一。
今年上半年,Kimi 在海外曾推出过一款 AI 生成 MV 的产品——Noisee.